ارتقای کیفیت دستهبندی متون با استفاده از کمیته دستهبند دو سطحی
نویسندگان
چکیده مقاله:
امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دستهبندی خودکار اهمیت ویژهای یافته است. روشهای معمول در این زمینه، روشهای یادگیری ماشین هستند. روشهای بر اساس کمیته کارایی بهتری نسبت به سایر روشها از خود نشان دادهاند. در این مقاله، دو ایده در زمینه کمیتههای دستهبند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعهای از مجموعه سندهای آموزشی، ساخته میشوند، ارائه شده است. بر اساس این ایده، ابتدا مجموعه آموزش با یک روش خوشهبندی به چند خوشه، بر اساس مشابهت یا عدم مشابهت کلاسهای اسناد آموزشی، تقسیم میشود و سپس از روی هر خوشه از اسناد، یک دستهبند ساخته شده و به عنوان عضو کمیته قرار داده میشود (روش یادگیری اعضای کمیته یکسان است). در ایده دوم ساخت کمیتهای دو سطحی مطرح شده است. در این ایده اعضای کمیتههای سطح دوم خود کمیتههایی هستند که بر مبنای ایده اول ساخته میشوند. در ارزیابی ایده اول مشخص شد که افزایش کارایی بر مبنای معیار دقت و معیار بازخوانی در کمیته بیزین ساده نوع اول، بیشتر از سایر کمیتههای نوع اول بوده و به ترتیب 12 درصد و 1/5 درصد میباشد. ارزیابیها در کمیته نوع دوم (برمبنای ایده دوم)، افزایش کارایی را نسبت به کمیته نوع اول نشان میدهند که بیشترین آن نسبت به کمیته Rocchio نوع اول بوده، که معیار دقت را در حدود 8/3 درصد و معیار بازخوانی را در حدود 8/18 درصد افزایش داده است.
منابع مشابه
ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی
امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت ویژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندها...
متن کاملتشخیص و دستهبندی ترکهای روسازی با استفاده از شبکههای پیچشی عمیق
ارزیابی اطلاعات روسازی یکی از مهمترین گامهای پیادهسازی سامانه مدیریت روسازی است و سالانه تلاشهای گستردهای به منظور افزایش کارایی این سامانه با استفاده از فناوریهای جدید انجام شده است. در سالهای اخیر تمرکز سازمانها بر توسعه سامانههای خودکار به منظور برداشت و ارزیابی بهتر اطلاعات روسازی بوده و تحقیقات گستردهای در این زمینه انجام شده است. دانش دادهکاوی و یادگیری ماشین با هدف بهرهگیری ا...
متن کاملارتقای کیفیت نفت زیستی با استفاده از راکتور پلاسما
افزایش تقاضا برای سوخت های فسیلی و اتمام قریب الوقوع این منابع و به دنبال آن پیش بینی افزایش قیمت جهانی انرژی به دلیل محدودیت منابع فسیلی، جهان را با بحران انرژی روبه رو ساخته است. از این رو اهمیت و ضرورت تغییر سیستم فعلی تولید و مصرف انرژی و جایگزینی آن با منابع انرژی های تجدیدپذیر برای پاسخگویی به نیاز انرژی جهانی در آینده نمایان می شود. زیست توده بعنوان یکی از منابع انبوه انرژی های تجدیدپذیر...
ارتقای کیفیت آموزش در سامانههای آموزش الکترونیکی با استفاده از دادهکاوی آموزشی
آموزش الکترونیکی، عبارت است از انجام فرایند آموزشی بر روی بستر ارتباطات الکترونیکی همچنین بهرهگیری از فناوری شبکه برای طراحی، ارائه و توسعه آموزش میباشد که فراگیران، کارشناسان و تهیهکنندگان مطالب را در بر میگیرد. در این میان حجم وسیعی از اطلاعات مانند نحوه تعامل کاربر با سامانههای مدیریتی آموزش، دروس انتخابی دانشجو و نمرات دانشجویان ذخیره میگردد. این دادهها حاوی اطلاعات با ارزشی برای مطا...
متن کاملارتقای کیفیت نفت خام فوق سنگین با استفاده از سدیم مولیبدات تجاری
مطابق آمارهای مراجع بین المللی، بهتقریب نیمی از ذخایر نفتی جهان به پایان رسیده است که لزوم استفاده هر چه بهینهتر از ذخایر فعلی، بهویژه تبدیل باقیماندههای سنگین نفتی و نفت خام فوق سنگین به ترکیبهای سبکتر را نشان میدهد. این پژوهش به بررسی استفاده مستقیم از سدیم مولیبدات تجاری به عنوان کاتالیستی در دسترس و ارزان برای ارتقای کیفیت نفت خام فوق سنگین و باقیماندههای سنگین نفتی میپردازد. ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 41 شماره 7
صفحات -
تاریخ انتشار 2007-11-22
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023